مجلهی مادربورد در اوت امسال پروندهای را به مایکروسافت و گوشدادن به صدای کاربران ایکسباکس اختصاص داد. در آن پرونده، گفته شد ردموندیها برای بهبود کارایی سرویس خود، صدای ضبطشدهی کاربران را به پیمانکاران ارسال میکنند تا به آنها گوش دهند. در ابتدای همان ماه، خبر مشابهی دربارهی گوشدادن به صدای کاربران اسکایپ و دستیار صوتی کورتانا منتشر شده بود. طبق ادعای پیمانکاران، برخی از محتوای بررسیشدهی کاربران حاوی اطلاعات بسیار شخصی آنان بود.
مقالههای مرتبط:
مایکروسافت یکی از شرکتهای متعددی است که از نیروی انسانی برای نظارت و بررسی دادههای کاربران استفاده میکند. در ماههای اخیر، برنامههای مشابهی در گوگل و آمازون و فیسبوک گزارش شدهاند و حتی اپل که ادعا میکند به دادههای کاربرانش بسیار اهمیت میدهد، رویکردهای مشابهی داشته است.
دستیارهای هوشمند صوتی و چتباتها روزبهروز محبوبتر میشوند. در این میان، شرکتهای فناوری با مشکل بزرگ و جدیدی روبهرو هستند. الگوریتمهای هوش مصنوعی آنها برای کار با پیچیدگیهای زبانی انسانها طراحی نشدهاند؛ به همین دلیل، آنها عموما در درک زمینه و موضوع دستورهای کاربران با مشکل مواجه میشوند.
درحالحاضر، بهترین راه برای رفع مشکل مذکور، استخدام نیروی انسانی است که الگوریتمها را به مسیر صحیح هدایت کند. برای پیادهسازی این راهکار نیز عموما پیمانکاران باید به صدای کاربران واقعی گوش دهند. آنها برخی اوقات با مکالمههای بسیار شخصی کاربران سروکار دارند که باید به متن تبدیل شوند.
مسئلهی درک زبان
دستیارهای صوتی مبتنیبر صدا مانند الکسا و سیری و کورتانا بهدلیل فناوری یادگیری عمیق به پیشرفتهای کنونی دست یافتهاند. یادگیری عمیق زیرمجموعهای از هوش مصنوعی محسوب میشود که در سالهای اخیر، بیش از همه در صدر اخبار بوده است. الگوریتمهای یادگیری عمیق عموما در پیداکردن الگوهای مشابه و دستهبندی اطلاعات قوی هستند.
وقتی الگوریتم یادگیری عمیق میلیونها صدای ضبطشده را بههمراه متن هرکدام بهعنوان ورودی دریافت میکند، در تبدیل مکالمههای جدید به متن، دقت بسیار زیادی مییابد. یادگیری عمیق در پیشبینی رخدادها نیز بسیار قدرتمند است. وقتی الگوریتم هوش مصنوعی را با دادههای بسیار زیاد تربیت کنید، توانایی تشخیص روابط ریاضی را در ترتیب کلمههای هر متن و مکالمه پیدا میکند و درنهایت، وظایفی همچون کاملسازی جملهها را با قدرت بیشتری انجام خواهد داد.
یادگیری عمیق با وجود همهی مزایا، در درک معنی کلمهها و جملهها ناتوان است. چنین وظیفهای هیچگاه فقط با تکیه بر مهارتهای ریاضی و آمار انجامشدنی نخواهد بود. گری مارکوس، دانشمند علوم شناختی و مدیرعامل شرکت Robust AI، دربارهی درک صحبت و فهم زبان طبیعی ازطریق هوش مصنوعی میگوید:
تشخیص گفتار و درک زبان طبیعی بهنظر مشکلات مشابهی هستند؛ اما درنهایت، آنها تفاوتهای عمدهای باهم دارند. در تشخیص گفتار، سیلابها و واجهای محدودی در زبان دارید. بهعلاوه، تلاش میکنید جریانی صوتی را به مفهومی در دستهبندیهای محدود تبدیل کنید.
زبان انگلیسی بهعنوان پرکاربردترین زبان جهان برای بررسی قدرت هوش مصنوعی بررسی میشود. درحالحاضر، دههاهزار کلمهی پرکاربرد در این زبان وجود دارد. در دوران کنونی که بهنام «کلانداده» شناخته میشود، میتوان بهآسانی میلیونها مثال از هریک از کلمهها پیدا کرد و هوش مصنوعی را بهکمک آنها آموزش داد.
درمقابل درک کلمهها، تجزیه و تفسیر جملهها فرایندی بسیار دشوارتر خواهد بود. در موضوع تنوع جملهها، میتوان تعداد نمونهها را بیشمار دانست که هرکدام هم معانی متفاوتی دارند. در این میان، معانی کلمهها هم بسته به موقعیت قرارگیری در جمله و کلمههای قبل و بعد متفاوت میشود. مارکوس درادامهی صحبتهای خود دربارهی درک و تفسیر جملهها میگوید:
تقریبا تمامی جملههایی که روزانه میشنویم، جملهی منحصربهفرد محسوب میشوند؛ البته تعداد بسیار محدودی از آنها از این قائده مستثنی هستند. درواقع، هیچ دادهی مستقیمی از جملهها نداریم و درنتیجه، در تفسیر و درک آنها با مشکل مواجه خواهیم بود. روشهایی که اکنون برای دستهبندی موارد و جانمایی آنها در گروههای متعدد استفاده میشوند، برای درک جملهها کاربردی نخواهند بود. درک زبان بهمعنای اتصال درک کنونی شما از جهان پیرامون به کلمههایی است که مخاطبان برای توضیح آن بهکار میبرند.
مارکوس کتاب جدیدی بهنام Rebooting AI دارد که در آن به مشکلات درک و رمزگشایی زبان انسانی بهوسیلهی هوش مصنوعی اشاره میکند. از تواناییهای که ما انسانها در درک جملهها داریم، میتوان به استفاده از دانش کنونی دربارهی جهان برای گرهگشایی از مسئلهها و پیچیدگیهای زبان نوشتاری و گفتاری مخاطبان اشاره کرد.
مکالمههای روزمره ابهامهای زیادی دارند. بهعنوان مثال، میتوان بهمعنی متفاوت کلمهی «در» در جملههای گوناکون اشاره کرد. در جملهای «در» میتواند ورودی اتاق یا ساختمان یا هر مفهوم بسته باشد و در مثالی دیگر، «در» برای مفهوم داخل چیزی بودن استفاده میشود. انسانها با شنیدن جملههای شامل این کلمه، دشواری زیادی در تشخیص مفهوم آن نخواهند داشت؛ چون ترکیب کلمههای قبل و بعد و شرایط گفتن جمله را درک میکنند.
چرخهی بیپایان آموزش
همه میدانیم ابزارهای یادگیری عمیق، عقل سلیم بهمعنای عقل انسانی ندارند. آنها فاقد دانشی جامع از جهان هستند و شرکتهای فناوری برای بهبود آنها هیچ چارهای جز افزایش آموزش با مثالهای متنوع نخواهند داشت. درواقع، آنها امیدوار هستند تمامی نمونهها و انواع مثالهای داده را بهعنوان ورودی به الگوریتم وارد کنند تا همهی آنها را بشناسد؛ درنتیجه، شرکتها به نیروی انسانی نیاز پیدا میکنند که عموما هم بهصورت دورکار و پیمانکاری، وظایف را انجام میدهند. آنها کارایی هوش مصنوعی شرکت را بررسی و اعتبارسنجی و دادههای صوتی را به متن تبدیل میکنند که الگوریتم از تبدیل آنها عاجز است.
انسانها برای توضیح انواع موضوعات، از مفاهیم و تعریفهای گوناگونی استفاده میکنند و هرروز نیز به تعداد تعریفها و عبارتها افزوده میشود؛ درنتیجه، آموزش بیشتر مانند راهکاری موقت برای چالش هوش مصنوعی خواهد بود.
درواقع، همیشه مثالهایی وجود دارند که هوش مصنوعی برای درک آنها آموزش ندیده است. پیشرفت و تکامل زبان بشری نیز همیشه ادامه دارد. تمام آنچه گفته شد، نیاز به آموزش را تشدید میکنند و درنتیجه، بازهم داستانها و اخباری دربارهی گوشدادن نیروی انسانی به صداهای کاربران را شاهد خواهیم بود.
مارکوس دربارهی روشهای کنونی تکامل هوش مصنوعی میگوید:
ضعف فناوری کنونی در نیاز همیشگی آن به داده دیده میشود؛ بهویژه در مسائل باز همچون درک مفاهیم زبان طبیعی، چنین نیازی بیشتر میشود؛ درنتیجه شرکتها برای تأمین نیاز فناوری، انواع فعالیتها را انجام میدهند. از دیدگاه من، جمعآوری دادهی بیشتر به حل مشکلات شرکتها کمک نمیکند. شاید این رویکرد تا حدودی به کاهش مشکلات کمک کند؛ اما قطعا آنها را بهصورت کامل رفع نمیکند.
بدون تزریق مفهوم عقل جامع و دانش پایهای به الگوریتمهای یادگیری عمیق، نمیتوان هیچ امیدی به حل کوتاهمدت مشکل آنها داشت. تا وقتی شرکتها برای آموزش الگوریتمهای خود دادههای کاربران را جمعآوری و تفسیر میکنند، باید برای واکنش شدید حامیان حریم خصوصی و اقدامهای احتمالی قانونگذاران این حوزه آماده باشند. همین موارد باعث شد تعدادی از شرکتها سرعت روند جمعآوری و تفسیر دادههای کاربران را کاهش دهند؛ ولی بهصورت کامل آن را متوقف نکردند.
اپل در اوت امسال، بیانیهی عذرخواهی در وبسایت خود منتشر کرد که به اشتراک دستورهای کاربران در سیری با پیمانکاران مرتبط بود. کوپرتینوییها متعهد شدند تنها درصورت مشارکت مستقیم کاربر در طرحهای آزمایشی و تحلیل داده از اطلاعات او برای آموزش هوش مصنوعی استفاده خواهند کرد. گوگل هم فعالیتهای تحلیل دادههای کاربران را در اروپا متوقف کرده است. قوانین حفاظت از دادههای کاربران در این قاره با جدیت بیشتری اجرا میشوند؛ البته برنامهی اهالی مانتینویو در مناطق دیگر جهان نیز ادامه دارد.
مایکروسافت هم مانند غولهای دیگر دنیای فناوری اسناد سیاست حریم خصوصی خود را بهروزرسانی کرد. اکنون کاربران آنها میدانند شاید مکالمهها و دستورهای صوتیشان را نیروی انسانی شنیده و بررسی کرده باشد. درنهایت، آمازون نیز سیاستهای خود را تغییر و امکان خروج از برنامهی تفسیر داده را به کاربران داد؛ هرچند بسیاری از آنها به چنین امکانی توجه نمیکنند یا از آن اطلاع ندارند.
مارکوس اعتقاد دارد در طولانیمدت باید چشماندازهای جدیدی در حوزهی هوش مصنوعی ایجاد شود. او درپایان مصاحبه میگوید:
باید در حوزهی هوش مصنوعی بیشتر تحقیق کنیم. درواقع، باید فرهنگ را از ساختار مبتنیبر داده و رباضیات به فرهنگی تبدیل کنیم که ایدههای موجود در زمینههای دیگر همچون روانشناسی و فلسفه و زبانشناسی را هم بپذیرد. زمینههای مذکور مطالعهی دقیقی دربارهی چگونگی فعالیت ذهن انسان کردهاند و احتمالا به ساختن تجربههای بهتر و دقیقتر هوش مصنوعی کمک میکنند.
.: Weblog Themes By Pichak :.